• 検索結果がありません。

情報の表現 | 記号・符号化 ( その 1)

N/A
N/A
Protected

Academic year: 2021

シェア "情報の表現 | 記号・符号化 ( その 1)"

Copied!
9
0
0

読み込み中.... (全文を見る)

全文

(1)

情報の表現 — 記号・符号化 ( その 1)

山本昌志 2007 年 10 月 19 日

概 要 情報の表現の方法を学ぶ.

1 本日の学習内容

情報の表現の方法とデジタル化の基礎を学ぶ.教科書 [1] の pp.11–27 が本日の範囲である.そして,本 日の授業のゴ ールは以下のように設定している.

ˆ 情報の表現には様々な方法があることが分かる.

ˆ アナログデータをデジタルデータに変換する方法が分かる.

ˆ 標本化定理が理解できる.

ˆ 信号を周波数に分解でき,データを圧縮できることが分かる.

2 情報の表現

2.1 表現のさまざまな側面

情報を表現するためには,自然言語と人工言語による表現がある.我々が使っている日本語は自然言語 で,プログラミング言語は人工言語である.

ˆ 自然言語と人工言語を列挙してみよう.

教科書の例に書いてあるように,道案内を行う場合,手続き的表現と宣言的表現がある.

2.2 情報の表現とモデル

情報を表現するためには,上手に複雑な現実を分かりやすくモデル化することが重要である.教科書では,

単純化/抽象化された事物/事象/概念のことを一般にモデル化と言う.

独立行政法人  秋田工業高等専門学校  電気情報工学科

(2)

と書いている.これはど ういうことなのだろうか? 教科書ではジェット機のモデル化の話がある.諸君は,

伝送線路を集中定数モデル化する方法を知っているだろう.

見方を変えれば,すべの情報はモデル化されると言っても良いだろう.また,同じものを見ても,さまざ まなモデル化ができる.数多くあるモデルのうち,ど のようなモデルが良いのだろうか? 一般的には,次 のようなことを満たすモデルが良いとされている.

ˆ 広範囲に適用できること.

ˆ 単純であること.

モデル化したものを表現する代表的な方法が,表と図,グラフである.このあたりの話は教科書の通り.

3 記号と表現

3.1 ピクトグラム

図記号 (ピクトグラム:pictogram) は,絵文字とか呼ばれるもので,視覚的に分かりやすく瞬時にそれが

表す情報が分かる.コンピューターのアイコンが代表的なものである.それ以外に,教科書に書いてあるよ うな高速道路のサービスエリアがある.

3.2 数の表現

この辺の話は,3 年生の電子計算機で説明した内容とほとんど 同じである.忘れたものは,そのときの講 義ノート

1

を見よ.

時間があれば説明するが,教科書を読めば,直ちに理解できる内容である.

4 アナログとデジタル

4.1 アナログ表現とデジタル表現

自然界で観測される量は,ほとんど 全てアナログデータと言っても良い.それは,時間的に連続的に変化 する.例えば,皆さんが発生する声のデータをマイクロフォンを使って電圧に変化させて,観測すると図 1 のようになるかもしれない.

アナログデータをデジタルデータに変換する場合,ある等間隔

2

の時刻で信号を観測する.先ほどのマイ クロフォンから出てくる電圧であれば,図 2 のように観測する.図中の●が観測データである.このよう にデータを取り出す操作を標本化 (sampling) と呼ぶ.

時刻を等間隔で区切って観測するように,電圧も等間隔に区切る.電圧の区切る話は,次の「量子化」で 述べる.

1

http://akita-nct.jp/yamamoto/lecture/2005/3E/2nd/html/index.html

2等間隔である必要は無い.しかし ,等間隔の法が圧倒的に後での利用が簡単である.

(3)

標本化により取り出させたデータは,数値化されて保存できる.図 1 のようなアナログ量が連なった数 値 (数列) として,表されたことになる.このように数値の列に情報を表現すると,コンピューターでは容 易に取り扱うことができる.このようなデータをデジタルデータと呼ぶ.

もちろん,この数列から,元のアナログ信号を再構成できなくては,意味がない.再構成した様子を図 3 に示す.この図から,再構成された信号は元のデータと似ているが,多少,波形が異なることが分かる.す なわちデータが劣化したのである.データをデジタル化する場合,このデータの劣化は避けることができ ない.

ˆ 元のアナログ信号と比較して,DA 変換して再構成した信号のどの部分の誤差が大きいか ?

ˆ そもそも誤差はどのように定義すれが良いだろうか?

ˆ デジタルデータを再構成する場合,図 3 よりも誤差を小さくする方法を考えよ.

(4)

時刻

電圧

図 1: 観測したアナログデータ.全ての時刻で値があり,連続に変化している.

時刻

電圧

図 2: アナログ信号をサンプリングを行い,データをデジタル化している.等間隔の時刻で測定した電圧が 記録される.また,電圧も特定の電圧間隔で測定している.この電圧を記録したものがデジタルデータで ある.

時刻

電圧

図 3: デジタルデータから元の信号を再構成する.

(5)

4.2 量子化

AD 変換器により,アナログデータをデジタルデータに変換することを量子化という.量子力学で学んだ ように,原子の内部にある束縛された電子は連続的なエネルギーを持つことができず,とびとびの値 (離散 的な値) を持つ.このように離散的な値を持つものを総称して量子と呼ぶ.

音声信号を 10 ビットで量子化することを考える.音声信号は,-5[V]〜5[V] の範囲の電圧信号とする.10 ビットなので,2

10

= 1024 段階に分解できる.従って,分解能は,

10

1024 1 ' 0.009775 (1)

となる.したがって,0.009775[V] 以下の電圧の変化は AD 変換器では区別できない.

4.3 標本化定理

アナログ信号をデジタル化するとき,サンプリングを行い,電圧信号に変換する.この作業を標本化と言 う.標本化を行うとき,サンプ リング間隔に気をつけいないと,元の情報をきちんと再生できない.

サンプリング間隔が信号の周期よりも長くなると,元の信号の再生ができない.もちろん,これは直感的 に理解できる.それでは,信号の周期とサンプ リング間隔ではど のような関係があるのだろうか? これは シャノン (Claude Elwood Shannon,1916–2001) によって,示された.

サンプ リング周波数 f s の半分の周波数以上の周波数はきちんと再生できない.

要するに,信号の周波数がサンプリング周波数の半分以上になるとダ メと言うことである.従って,サンプ

リング周波数は元の信の周波数の

2

倍以上にしなくてはならない

—ということである.サンプ リング周波 数の半分の周波数をナイキスト周波数という.

サンプリング周波数を f S としたとき,入力信号の周波数( f i )がナイキスト周波数より大きいと,その 信号周波数が f Sf i として標本化される.このような現象を,エイリアシング (aliasing)

3

と呼び ,その 様子を図 4 に示す.この例ではサンプ リング周波数が 1[KHz] なのでナイキスト周波数は 0.5[kHz] になる.

信号の周波数が 0.6[kHz] とナイキスト周波数よりも高いので,サンプ リング周波数と信号の周波数の差,

0.4[kHz] が標本化される.実際の信号と異なるので,非常にまずいことになる.

CD のサンプリング周波数 f S = 44.1[KHz] の場合,ナイキスト周波数は 22.05[kHz] である.音声信号に このナイキスト周波数以上の信号が混じると,へんな音が再生されることになる.そのため,信号を AD 変 換するときには,ローパスフィルターをつけて,ナイキスト周波数以上の信号が混じらないようにしている.

エイリアシングには,いろいろな場面で遭遇する.蛍光灯の下で扇風機を動かし始めるときと止めるとき にエイリアシングが起きる.羽がゆっくり回って見えたり,止まったり,逆回転が見えたりする.また,テ レビの中で車のタイヤの回転が同じように見えることがある.これはすべてエイリアシングが起きている.

ˆ 蛍光灯の元でのサンプ リング周波数は,いくらか?

ˆ TV を通して観察するときのサンプ リング周波数は,いくらか?

3専門用語なので辞書に載っていない.alias:別名.

(6)

-1 -0.5 0 0.5 1

-4 -2 0 2 4

Volt [V]

Time [msec]

図 4: エイリアシングの例.点線が実際の信号 (0.6[kHz]) で,それを 1[KHz] でサンプ リングした.●がサ ンプ リングの結果である.サンプ リングの結果は,実線で表した 0.4[kHz] の信号と一致する.

なぜこのようなことが生じるか? 考えてみよう.いろいろな説明方法を考えたが,どれも結構難しい.4 年生のときに学習した複素フーリエ級数

4

を使うとど うだろうか.

サンプ リングは,図 5 の点線の矩形波を信号に乗算していると考える.この矩形波の幅がゼロ近づく極 限

5

がサンプリングとなる.いくら幅が狭くても,この矩形波 g(t) は,繰り返し波形なのでフーリエ級数

6

で 表すことができるであろう.

g(t) = X

n=

−∞

C n e inω

s

t (2)

ここで,ω s がサンプ リングの角振動数である.標本化する信号を f i (t) とすると,標本化された信号は

V (t) = f i (t) X

n=

−∞

C n e inω

s

t (3)

となる.簡単に考えるために,標本化される信号が三角関数 Ae

i

t であった場合を考える.この場合,

V (t) = Ae

i

t X

n=

−∞

C n e inω

s

t (4)

と標本化される.ここで,サンプ リング周波数と信号の周波数の関係を次のように書き改める.

ω i = ω s ω

1

(5)

4デ ィラックの

δ

関数を使うと,もっとエレガントな説明ができるかも???

5実際の測定では矩形はは有限の幅を持つ.ゼロの極限では観測できない.数学ではゼロの極限で取り扱う.

6複素フーリエ級数を使っているが,オイラーの公式

e

ix

= cos(x) + i sin(x)

を考えれば簡単.

(7)

この関係を使うと,式 4 は

V (t) = Ae

i

t X

n=

−∞

C n e inω

s

t

= Ae i(ω

s

ω

1)t

X

n=

−∞

C n e inω

s

t

= Ae

1

t X

n=

−∞

C n e i(n+1)ω

s

t

= Ae

1

t X

n=

−∞

C n e inω

s

t (6)

と書き換えることができる.この結果は,サンプ リング角周波数 ω s の場合,角周波数 ω i の信号と,角周 波数 ω

1

= ω s ω i の信号の見分けがつかないと言っている.すなわち,サンプリング周波数が 1[kHz] の場 合,0.6[kHz] の信号は 0.4[kHz] の信号と同じと言うことである.

以上の結果から,サンプリング周波数が 1[kHz] の場合,その半分の周波数 (0.5[kHz]) まで再生がきちん と再生できることになる.むろん,再生した信号には 0.5[kHz] 以上を含んではならない.

1

T

s

図 5: 実線が実際の信号で.●がサンプリングの結果である.点線の矩形がサンプリングを取り出す関数で ある.

4.4 周期周波数への分解

教科書のこのあたりの話は,計算機によるフーリエ変換と関係している.

諸君が昨年の応用解析で学習したフーリエ変換は数学だったので,関数 f (x) は連続的な値であった.し

かし,実際の測定量,例えば電圧など 連続的に測定してそのデータが蓄えられるわけではない.連続ではな

く離散的なデータとなる.これをフーリエ変換する方法を示す.

(8)

ここでも話を簡単にするために,周期を 2π とする.その,周期の中で N 個の等間隔でデータが得られた としよう.いわゆる,サンプリングである.データが等間隔に並ぶということは FFT で重要となる.ここ では FFT まで,話をしない.

サンプ リングで得られたデータを x j = 2π

N j (j = 0, 1, 2, · · · , N 1) (7)

とする.この場合,サンプ リング周波数は N/(2π),角振動数は N となる.ここで得られデータを

f j = f (x j ) (8)

とおく.

準備ができたので,実際のフーリエ級数の式 f (x) =

X

−∞

C n e inx (9)

を評価することになる.しかし ,ここでは測定量である f jx j はそれぞれ N 個である.従って,フーリ エ係数の c n も N 個しか決めることができない.そうすると展開の基底も N 個までである.その基底として

n

1, e ix , e

2ix

, e

3ix

, · · · , e

(N1)ix

o

(10)

をとる.周波数領域で考えると,0 から始まり T /(N 1) まで等間隔の周波数で展開するのである.した がってフーリエ級数の展開式は,

f (x) =

N X

1

k=0

c k e ikx (11)

となる.ここで残された問題は,測定量の x jf j から c k を決めることである.これは比較的簡単で,

f j =

N X

1

k=0

c k e ikx

j

(j = 0, 1, 2, · · · , N 1) (12)

の連立方程式を解けばよい.この式の形が分かりにくい—と言う人もいるだろう.もう少し分かり易く書 くと次のようになる.

 

 

 

  f

0

f

1

f

2

.. . f N

1

 

 

 

 

=

 

 

 

 

1 1 1 . . . 1

1 e ix

1

e

2ix1

. . . e

(N1)ix1

1 e ix

2

e

2ix2

. . . e

(N1)ix2

.. . .. . .. . . . . .. . 1 e ix

N−1

e

2ixN−1

. . . e

(N1)ixN−1

 

 

 

 

 

 

 

  c

0

c

1

c

2

.. . c N

1

 

 

 

 

(13)

x j は測定量なので,この N × N は計算可能である.この連立方程式から,未知数であるフーリエ係数 c k を決めることになる.実際の場では,連立方程式を計算すると時間がかかるので,もっと上手に計算する.

高速フーリエ変換 (FFT:Fast Fourier Transform) を使う.この辺の話はおもしろく,結構勉強になるので,

興味のあるものは調べてみると良い.

(9)

ここで,サンプリングで得られた N 個のデータから,N 個の周波数に分解できることが理解できた.得 られた N 個の周波数の振幅は大きいものもあれば,小さいものもある.小さいものは,信号の再生に寄与 が少なく,それを加算しなくても,大体もとの信号と同じ形になる.従って,寄与の少ない信号を無視する ことにより,サンプリングのデータ数よりも小さいデータ数で再生ができる.これは,データの圧縮に他な らない.

5 課題

5.1 課題内容

以下の課題を実施し ,レポートとして提出すること.

[問 1] (復予) 教科書 [1]pp.11–33 を 2 回読め.レポートには「2 回読んだ」と書け.

[

2] (復) 教科書 [1] 章末問題 (p.35) の [2.1]

[問 3] (復) 教科書 [1] 章末問題 (p.35) の [2.2]

[問 4] (復) 教科書 [1] 章末問題 (p.35) の [2.3]

5.2 レポート 提出要領

期限 10 月 26 日 (金) AM 8:45

用紙 A4 のレポート用紙.左上をホッチキスで綴じて,提出のこと.

提出場所 山本研究室の入口のポスト

表紙 表紙を 1 枚つけて,以下の項目を分かりやすく記述すること.

授業科目名「情報理論」

課題名「課題   情報の表現—記号・符号化 (その 1)」

提出日

5E 学籍番号 氏名

内容 2 ページ以降に問いに対する答えを分かりやすく記述すること.

参考文献

[1] 河合慧編. 情報. 東京大学出版会, 2006.

参照

関連したドキュメント

すべての Web ページで HTTPS でのアクセスを提供することが必要である。サーバー証 明書を使った HTTPS

補助 83 号線、補助 85 号線の整備を進めるとともに、沿道建築物の不燃化を促進

(2) 管の記号はⅠ種管の品名「強化プラスチック複合管」の略号 PFP(Polyester Concrete Fiberglass Reinforced Plastic

2 号機の RCIC の直流電源喪失時の挙動に関する課題、 2 号機-1 及び 2 号機-2 について検討を実施した。 (添付資料 2-4 参照). その結果、

信号を時々無視するとしている。宗教別では,仏教徒がたいてい信号を守 ると答える傾向にあった

(2,3 号機 O.P12,000)換気に要する時間は 1 号機 11 時間、 2,3 号機 13 時間である)。再 臨界時出力は保守的に最大値 414kW

この設備によって、常時監視を 1~3 号機の全てに対して実施する計画である。連続監

さらに、1 号機、2 号機及び 3